智能晚报|Office 365中的生成式AI功能定价30美元/月;ASML二季度订单24%来自中国;Meta发布第二代大语言模型
「每天重要的新闻不会超过五条」
撰文:陆彦君
编辑:吴洋洋
Key Points
微软给Office 365中的生成式AI功能定价30美元/月;
Meta发布第二代大语言模型Llama2;
英伟达拟入股AI云服务商Lambda Labs;
GPT变笨有证据了;
ASML二季度订单中24%来自中国。
微软给Office 365中的生成式AI功能定价30美元/月
微软计划对其在Microsoft 365中提供的生成式AI功能(即Copilot),每月收费30美元。
Microsoft 365 Copilot是什么
3月16日,微软发布了这一最新版本的办公套件。相较于Microsoft 365(曾用名「Office 365」,包括Word、Excel、PowerPoint、Outlook、Teams等办公软件),Microsoft 365 Copilot中加载了生成式AI助手Copilot,该AI助手基于OpenAI的最新多模态模型GPT-4。
Microsoft 365 Copilot目前仍处于测试阶段,未来向市场开放时间未知。
30美元/月的定价比外界预期高
对于Microsoft 365的既有用户,每月30美元的订阅费用将使其月费上涨53%至83%。作为对照,高阶版的ChatGPT每月只向用户收取20美元,同为微软旗下的AI编程助手GitHub Copilo每月也仅收费19美元。Microsoft 365 Copilot的月费价格与这些同行相比高出50%。
不过,这在投资者看来有益于微软的收入增长。根据微软上季度财报,Microsoft 365现有3.82亿的付费用户,如果这些用户都开始为办公软件中增加的生成式AI功能付费,那么微软将因此每月增收114.6亿美元。
微软365 Copilot定价发布后,微软股价上涨近4%。
这个定价是在微软的年度合作伙伴大会「Inspire Event」上发布的,一同发布的内容还包括:
·Copilot功能扩展至Teams的通话与聊天场景
Copilot作为微软的生成式AI助手,此前已被加载到微软的搜索引擎Bing、编程工具GitHub、文档工具Word、操作系统Windows 11等诸多产品中。7月18日的Inspire Event大会上,微软宣布将Copilot引入Teams,后者是微软旗下的线上会议平台,类似于Zoom和国内的腾讯会议、飞书、钉钉。
加载Copilot后的Teams可以在用户与客户打电话时总结通话内容,如果用户是一名销售,它还能及时在双方对话中捕捉有关产品功能、优势和定价的问题,记录客户反馈,并向销售人员建议后续沟通内容。
·推出Bing Chat Enterprise
此前,各公司都对机密数据被拿去训练大模型而感到担忧。苹果、三星、沃尔玛、Verizon、美国银行、摩根大通等公司,都限制了内部员工对ChatGPT和微软Copilot等工具的使用。Bing Chat Enterprise是微软对此给出的最新对策——它是Bing Chat的一个独特版本。
微软称,用户通过这个版本的Bing Chat聊天,其聊天数据不会被保存,微软也无法查看客户的员工或业务数据,并且不会将客户数据用于训练底层AI模型。该聊天功能包含在Microsoft 365商业版的各个版本中,将作为独立订阅提供给用户,价格为每个用户每月5美元。
·为Bing Chat添加图像搜索功能
用户可以通过拍照或者选择图像上传,在网络上搜索相关内容。微软在新闻稿中解释:「Bing可以理解图像上下文、解释并回答有问题。无论去新城市度假,询问特定建筑的风格,还是在家里尝试根据冰箱的食材想出午餐创意,用户都可以将图像上传到Bing Chat,网络知识会提供答案。」
目前,Google的Bard聊天机器人已具备图像搜索功能,用户上传图片可以生成标题,或者获得与图片相关的餐厅推荐。ChatGPT与Claude的聊天方式目前都基于纯文本,尚未新增图像搜索。
参考链接:
https://www.bloomberg.com/news/articles/2023-07-18/microsoft-sets-expensive-price-tag-for-new-corporate-ai-products?srnd=technology-ai#xj4y7vzkg
Meta发布第二代大语言模型Llama 2
当地时间7月18日,Meta在微软的Inspire Event上发布了第二代大语言模型LIama 2,并称经过公开数据的训练,Llama 2的性能比上一代Llama模型有了显著提高。Meta宣布微软Azure为其首要合作伙伴,未来还将与高通展开合作。
LIama 2有哪些更新?
·训练参数增加
LIama 2(注:Llama是Large Language Model Meta AI的缩写,此前官方缩写格式为LLaMa,现已更改)接受了2万亿个token的训练,训练数量比上一代模型LIama(1.4万亿)多了40%。而且,其可处理的文本长度也是LIama的两倍。
Llama 2有两个版本:Llama 2和Llama 2-Chat,后者针对双向对话进行了微调。Llama 2 和Llama 2-Chat 进一步细分为拥有70 亿个参数、130 亿个参数和 700 亿个参数的3个不同版本。
·LIama 2将可以商用
今年2月,Meta发布了第一代大模型LIama,但不久后遭遇意外泄露,成为开源社区训练AI新模型的基础。那次泄露后,Meta宣布Llama模型开源,但仅供研究等非商业场景使用,不得用于商业。
现在,Meta宣布LIama 2可免费用于研究和商业用途,开发者可以在亚马逊云科技、微软Azure和Hugging Face的AI模型托管平台上调用该模型。
LIama 2表现如何?
·略逊于GPT-4和PaLM2
Meta称,LIama 2在推理、编码、熟练程度和知识测试方面,优于Falcon(开发者为阿联酋科技创新研究所TII)和MPT(开发者为MosaicML)等大模型。但是Llama 2略差于闭源竞争对手GPT-4(开发者为OpenAI)和PaLM(开发者为Google)。例如,Llama 2在计算机编程方面明显落后于 GPT-4。
·输出结果有偏差
Meta没有披露训练数据的来源,只提及它们来自网上具有「事实性质」的信息,大部分是英文。这导致输出结果存在偏差。例如,LIama 2生成代词「他」的速度,比生成代词「她」的速度快。LIama 2还有西方视角的倾向,文本里包括大量的「基督教」「天主教」和「犹太教」等词汇。此外,由于训练数据中包含「有害文本」,在「有害性」测试方面,LIama 2的测试结果并未优于其他大模型。
·无法涵盖所有现实场景
Meta表示,LIama 2目前无法涵盖所有现实场景,没有充分涵盖编程和人类推理等领域。
Meta与微软合作意味着什么?
Meta在微软的官方活动上发布了LIama 2,并表示微软是Llama 2 的首选合作伙伴。尽管Meta不会在与微软的合作中直接赚钱,但可能会因为将自主研发的AI软件交到更多开发者手中而受益。
今年2月,Meta第一代大语言模型LIama泄露后,开发者与研究者基于LIama接连发布了Alpaca、Vicuna、Dromedary等多个中小模型,训练成本仅需几百美元,硬件门槛也降低至一台笔记本电脑甚至一部手机,基于LLaMa的「羊驼家族」不断壮大,Meta很可能借此形成生态,成为最大赢家。
除了微软,高通也成了Meta的合作伙伴。高通宣布,从2024年开始将LIama 2引入笔记本电脑、手机和耳机,以支持无需依赖云服务即可运行的AI应用程序。
参考链接:https://ai.meta.com/llama/
英伟达拟入股AI云服务商Lambda Labs
据The information 7月18日报道,英伟达正在接近达成一项入股Lambda Labs公司的交易,交易总额可能达到3亿美元,包括新资本在内,该公司的估值可能超过10亿美元。稍早前,英伟达已经收购了Lambda Labs的竞争对手CoreWeave。
Lambda Labs这家公司是做什么的?
Lambda Labs是一家提供云服务的初创公司,总部位于美国旧金山。在向其他公司租赁配备英伟达芯片的服务器方面,与亚马逊云科技和其他老牌云提供商展开竞争。今年4月,Lambda Labs曾得到一笔4000多万美元的融资,其中一部分资金来自 OpenAI 联合创始人 Greg Brockman。
Lambda labs规模不大,但号称能提供全球价格最低的英伟达A100、H100算力资源。客户包括英特尔、微软、亚马逊研究院、麻省理工学院、斯坦福大学、哈佛大学和加州理工学院。
英伟达为什么要入股Lambda Labs?
英伟达是AI加速芯片领域的领导者,其先进AI芯片目前的市场占有率约为75%(了解英伟达如何成为AI芯片领域的主导者,可查看新皮层往日报道《AI「军火商」英伟达》)。不过现在,英伟达的角色正从芯片设计公司转向云服务提供商。
业界急需英伟达的GPU A100芯片,亚马逊、微软、Google和甲骨文纷纷限制其云客户租用。这几家巨头是采用英伟达芯片的AI服务器的主要客户,但也开发自己的AI芯片,以期摆脱对英伟达的依赖,这意味着它们未来可能会成为英伟达的竞争对手。以Lambda Labs为代表的初创公司则对英伟达构不成威胁。
新皮层曾报道,英伟达近期在生成式AI领域多次出手投资。如果本次交易达成,将是英伟达自3月以来的第8笔初创公司投资。英伟达可能会将GPU出售给初创的云计算公司,从而将GPU目标客户群从亚马逊、微软和Google等巨头转移,降低这些科技巨头的竞争威胁。
参考链接:
https://www.theinformation.com/articles/nvidia-accelerates-ai-startup-investments-nears-deal-with-cloud-provider-lambda-labs
有研究表明ChatGPT的确变笨了
来自斯坦福大学和加州大学伯克利分校的研究者近期发表了一篇论文,对今年3月和6月版本的GPT-3.5和GPT-4分别展开评估,发现传说中GPT变笨了的情况确实存在。论文发现,GPT-3.5 和 GPT-4 的表现和行为随时间变化可能会有很大差异。
在论文中,研究者评估了以下4种任务:
·解决数学问题:3月的GPT-4在识别质数方面表现非常出色,准确率为97.6%,但6月的GPT-4在回答相同问题上表现非常糟糕,准确率只有2.4%。然而,GPT-3.5的表现与之相反,GPT-3.5在6月的表现比3月好得多,准确率从7.4%提升到了86.8%。
·回答危险问题:相较于3月,6月的GPT-4对回答危险问题的意愿降低,回答概率由21%降到了5%。
·生成代码:相较于3月,GPT-4和GPT-3.5在6月根据指令生成的代码都变得更加冗长,且不太能直接执行。
·视觉推理:只有这一部分,GPT-4和GPT-3.5均出现了细微改善。
「ChatGPT 变笨了」的声音5月开始蔓延
对此,5月31日,Open AI的开发者关系团队负责人Logan Kilpatrick回应称,大模型一直处于静态,未出现大量外部数据污染模型的情况。不过他也承认,大模型不稳定,对相同的提示词的回答,可能前后不一致。
不过根据7月11日一篇来自以色列算法交易公司Deep Trading创始人Yam Peleg 的「GPT-4揭秘」推文,OpenAI可能在GPT-4的推理上使用了「推测解码」,即在接到用户需求、启动大模型计算之前,先使用一个更小更快的模型提前解码几个token,然后将它们作为一个单独批次输入到一个大的「oracle模型」中。
如果小模型预测得到大模型同意,系统就可以在一个批次中解码更多token。如果大模型拒绝了小模型的预测,那么剩下的批次就会被丢弃,接着使用大模型工作。GPT-4质量下降的「阴谋论」可能因为OpenAI面对用户需求,并没有每次都派出大模型出马解决。OpenAI并未对Yam Peleg 的推文作出回应。
论文地址:arxiv.org/pdf/2307.09009.pdf
富士康多方面投资印度
据7月18日彭博社报道,富士康去年从苹果的一家子公司购买了价值3300万美元的设备,用于在印度扩张业务。
印度市场对苹果的重要性在提升
Counterpoint Research数据显示,截至6月底,苹果在印度智能手机市场的份额达到5.1%,去年同期为3.4%。
目前,印度每年为苹果公司带来的收入仅为60亿美元,苹果每年从大中华区获得的收入达到750亿美元。不过,摩根士丹利(Morgan Stanley)分析师预测,未来5年,在印度的收入增长将占苹果公司收入增长的15%(超链接),而过去5年仅为2%。未来10年,苹果公司在印度的业务将增长6倍,年收入达到400亿美元。
与此同时,苹果也在印度市场迅猛扩张
2020年,苹果在印度推出了在线商店。今年4月,它在印度金融中心孟买和印度首都新德里分别开设了第一家和第二家实体店。此外,它也在将部分iPhone手机的生产从中国转移到印度。
上个财年,苹果在印度组装了超过70亿美元的iPhone,其中近7%的手机在印度生产。与此同时,富士康也计划投资约7亿美元在印度南部卡纳塔克邦建造一座新工厂,以提高iPhone零件的本地产量。
除了在印度组装苹果,富士康还想做印度造芯片
富士康并不满足于长期做各大厂商的组装厂,近年来也在发力高端制造。目前,富士康的半导体业务已经涵盖了晶圆代工、封测以及芯片设计等多个环节,集中在模拟、功率半导体、汽车芯片等成熟制程领域。
7月10日,富士康宣布退出与印度金属制石油集团Vedanta价值195亿美元的半导体合资企业。不过,它并没有完全对在印度生产芯片死心。在跟Vedanta合作失败后,富士康又开始拉拢台积电和日本TMH集团,以在印度设立四到五条芯片产线。
参考链接:
https://www.bloomberg.com/news/articles/2023-07-18/foxconn-buys-equipment-from-apple-for-expansion-in-india?srnd=technology-vp
Bouns
ASML二季度订单中24%来自中国
7月19日,光刻机厂商阿斯麦(ASML)发布财报,第二季销售额达到69.02亿欧元,去年同期为54亿欧元,增长近28%。其中,来自中国的订单增加了3倍,占比从8%增长至24%。
6月30日,荷兰政府颁布有关半导体设备出口管制的新条例,要求ASML需要向荷兰政府申请出口许可证,才能发运最先进的浸润式DUV系统(即TWINSCAN NXT:2000i及后续推出的浸润式光刻系统)。
该出口管制条例将于今年9月1日生效,在此日期前,ASML可开始向政府提交出口许可证申请,荷兰政府将视具体情况批准或拒绝这些申请。目前,ASML仍有约380亿欧元的积压订单未生产完成。
(关于上述出口管制的来龙去脉,还可阅读7月5日的智能晚报《美国拟限制中国AI公司使用美国云计算……》)
-END-
若想了解更多当日资讯,请点击阅读往期智能晚报
智能晚报|微信越来越不想让你「用完即走」;中芯国际两年内更换董事长;壁仞科技可能最快今年赴港上市
智能晚报|马斯克公布xAI公司战略细节;小米计划在印度开更多线下店;富士康也想要重返印度...
若想了解更多当日头条,请点击阅读往期头条新闻
智能头条|FTC给出了20页的质询函,OpenAI或面临最强监管
我们是一个诞生于GPT浪潮、由《第一财经》YiMagazine孵化的全新内容IP。
和每一位关心技术、关注人类命运的读者一样,我们希望在这个充满不确定性的时代,更好地理解快速变化的科技世界,也更好地理解生而为「高级智能」的我们自己。
在这个目标下,我们计划从学术、商业、伦理、监管等多个角度报道和讨论与「智能」相关的议题。请注意,我们说的智能,不只是 AI。
喜欢就关注我们吧,记得「设为星标」哦~
与记者交流,可添加微信(请备注公司名称和姓名):
王杰夫 微信号: wjfsty
张司钰 微信号: helianthus351
吴洋洋 微信号: qitianjiuye
再次,喜欢就关注我们吧,记得「设为星标」